Например, Бобцов

Решение задачи предварительного разбиения разнородных данных на классы в условиях ограниченного объема

Аннотация:

Введение. В условиях формирования существенно отличающихся по своей природе разнородных данных даже небольшого объема возникает необходимость их анализа для принятия решений. Это характерно для многих высокотехнологичных промышленных областей деятельности человека. Задача может быть решена путем приведения разнородных данных к единому виду с последующим разбиением на кластеры. Вместо поиска решения по каждому элементу данных предлагается использовать разбиение всей совокупности нормированных данных на кластеры, и тем самым упростить процесс вычленения кластера и принятия по нему решения. Метод. Сущность предлагаемого решения состоит в автоматической группировке объектов со схожими данными в кластеры. Это позволяет снизить объем анализируемой информации за счет объединения множества данных и выполнить математические операции уже для кластера. При разбиении предлагается использовать теорию нечеткой логики. Возможность такого подхода связана с тем, что различные объекты всегда имеют несколько признаков, по которым они могут быть объединены. Эти признаки чаще всего не являются явными и плохо формализуются. Основные результаты. Предложена иерархическая модификация метода распределения по нечетким кластерам, основанного на операции (max-min) нечеткого отношения сходства. Рассмотрены основные понятия и определения предлагаемого метода автоматического разбиения совокупности входных данных, поэтапная схема соответствующей кластер-процедуры. Работоспособность предложенного метода продемонстрирована на примере решения задачи формирования потока летательных аппаратов. В качестве исходных данных использована информация, которая имеется у лиц, принимающих решение, и анализируется вручную. Численный эксперимент показал, что разработанный алгоритм позволяет автоматически провести анализ информации и корректно сформировать поток. Обсуждение. Применение предложенной модификации позволяет провести предварительное разбиение данных на кластеры и снизить в дальнейшем объем анализируемых данных. При этом отсутствует необходимость рассматривать объекты в каждом случае отдельно.

Ключевые слова:

Статьи в номере